涂群等:我国公共数据授权运营的五大发展趋势
公共数据授权运营是与共享、开放并存的三种公共数据开发开放方式之一。主要由于大多数高价值公共数据都涉及公民个人隐私、企业秘密和国家安全,不能与其他主体直接共享,更不宜向社会直接开放,而长期沉淀在政府机关和公共事业单位内,无法释放其数据要素价值潜能。因而,有必要引入市场化机制,通过对涉敏涉密公共数据进行脱敏脱密处理后向社会有偿开放,从而增大公共数据供给。其中,授权运营是引入市场化机制开发开放公共数据的一种主要方式。我国公共数据授权运营将呈现以下五大发展趋势。
(一)授权运营将成为公共数据开发利用的最主要方式
当前,共享、开放和授权运营是公共数据开发利用的三种主要方式,其中,公共数据共享和开放已探索实践了20多年,也取得了许多成绩,但总体来看,公共数据共享开放数据规模依旧不大,数据质量依旧不高。造成公共数据共享开放程度不高的原因主要有两个:一是不能共享开放。大量高价值公共数据都是涉敏涉密数据,不能直接向社会开放,必须通过数据技术手段对数据进行脱敏脱密,而政府和公共机构没有预算承担不断迭代升级的数据技术,只能让这些数据束之高阁而不能使用,并且还要承担巨大的存储费用;二是不愿共享开放。公共数据数源部门提供的高质量数据不仅需要投入大量的时间、学习成本,并且按照当前“谁提供,谁负责”的数据安全管理政策法律,数源单位还要承担在持续应用中可能出现的数据安全法律责任。因此,数源部门的本能选择就是尽量不提供,尽可能少提供公共数据,以避免未来可能会承担的风险。
公共数据授权运营是解决公共数据不能共享开放、不敢共享开放的有效手段和方法。通过市场化机制,吸引技术水平高、安全能力强的企业对公共数据进行开发利用,一方面通过隐私计算、联邦计算、匿名化技术等技术手段,对涉敏涉密的公共数据进行脱敏脱密加工处理后,形成可以开放的公共数据产品和服务;另一方面市场化运营解决了财政支付不足问题,弥补了政府和公共机构数源部门在数据加工处理方面能力不足问题。随着更多地方和部门不断探索实践,公共数据授权运营将很快成为公共数据开发利用的最主要方式和最有效方式。
(二)公共数据集中统一授权运营将发展成为主流模式
当前,公共数据授权运营已形成集中统一授权运营、按区域分散授权运营、按专区分散授权运营三种模式。从发展现状来看,由于地方政府财政分灶、不同地方财政收入差异巨大等原因,采用按区域分散授权运营和按专区分散授权运营两种方式的省市数量最多,而真正采用集中统一授权的地方只有福建和山西两家,福建大数据集团和山西云时代公司不仅有权运营省级政府的公共数据,而且也运营所辖各市的公共数据。有一些省区虽然成立了省级数据集团,但省属各部门各地市的公共数据并没有统一授权给这家数据集团,实际运营过程中仍然采用了分散授权运营模式。但是,从发展趋势来看,由于公共数据是国家战略资源,必将由国家统一掌控和管理。就像工业化发展阶段的电力、通信、铁道等网状经济是国家战略资源,国家通过成立国家电网、南方电网、国铁集团、中国移动、中国电信、中国联通等央企进行控制和掌握一样,数据要素化发展成熟后,国家也将会通过组建一个或几个央企性质的“国家数据集团”,对全国公共数据进行控制和掌握。目前,数据要素化还处于探索发展的初级阶段,要充分调动各部门各地方的积极性对公共数据授权运营进行多元化探索,但是,在未来5-10年内,公共数据必然向省部级统一集中授权模式演进,甚至出现跨省跨领域的公共数据授权运营主体。
(三)公共数据授权运营平台正形成三种不同建设方式
三种模式在公共数据授权运营平台建设方面分别采取了三种不同方式:一是统一建设方式。以福建为代表的集中统一授权运营模式采用统一建设方式。福建大数据集团不但承担了省级公共数据授权运营平台的建设和运营,其下设的10个市级子公司承担了省下辖10个市的公共数据授权运营平台;二是省市分级建设方式。以浙江为代表的按区域分散授权运营模式采用了省市分级建设方式。省数据管理部门制定全省公共数据授权运营平台统一规范、统一标准,并承担省级公共数据授权运营平台的建设和运营,其下设的11个市的数据管理部门分别按照省统一规范和统一标准,承担各市公共数据授权运营平台的建设运营。公共数据授权运营单位对公共数据加工处理必须在各级公共数据授权运营平台上开展,并按照协议或约定向平台运营机构支付使用费。三是自建方式。以北京为代表的按专区分散授权运营模式采用了授权运营单位自建方式。目前已经运营多年的金融数据专区的授权运营平台,就是由北京金控集团作为金融专区运营单位(即授权运营单位),按照网络安全等级保护三级标准自行建设,平台具备数据加工处理人员的实名认证与备案管理、操作行为的记录和审计管理、原始数据的加密和脱敏管理、元数据管理、数据模型的训练和验证功能、数据产品的提供、交易和计价等功能。
今后3至5年内,政府分级建设和授权运营单位自建这两种方式将会更多涌现,特别是大量财政经费紧张的地方会将采用授权运营单位自建方式,地方政府将单位是否有财力建设公共数据授权运营平台作为其获取授权资质的衡量标准之一。但是,在5至10年内,各部门各地方统一建设公共数据授权运营平台,甚至跨领域跨区域建设更大范围的公共数据授权运营平台将成为发展主流和趋势。
(四)人工智能技术将成为授权运营机构的核心竞争力
公共数据授权运营的关键要素有三项:一是数据供给,即公共数据特别是高质量公共数据要供出来;二是授权平台,即公共数据加工处理必须在授权平台上操作;三是数据技术,即高价值公共数据要进行脱敏脱密必须采用各种隐私技术、数据挖掘技术和人工智能技术。其中,人工智能技术等数据技术水平的高低,在很大程度上决定了数据产品和服务的质量、数据产品的场景应用丰富度,将成为数商企业的核心竞争力。目前,以大模型为代表的通用人工智能已快速迭代升级到sora等文生视频的新高度,而sora生成过程中的训练和对齐已对原始数据的依赖性大大减弱,而合成数据正在走向数据资源的前台,一方面对数据企业开发利用公共数据模式提出颠覆性挑战,另一方面对数据企业人工智能技术水平提出了更高要求,在一定程度上可以说,一个数据企业的人工智能水平高低,决定了其核心竞争力的强弱,一个公共数据授权运营主体拥有人工智能技术水平高低,甚至会决定一个地区一个行业公共数据开发利用情况,甚至数字经济发展水平。
(五)国有控股高科技企业将成为主流的授权运营主体
公共数据授权运营最需要统筹发展和安全。即公共数据授权运营主体既要拥有领先的、独特的人工智能技术等数据技术,并凭借这些技术开发出有竞争力的数据产品和服务,才能在市场竞争中实现可持续发展,但同时也对授权运营主体的身份有较高的要求,以确保公共数据的安全可控可信,确保不造成国有资产流失。
目前已形成地方国资企业、国有全资企业、国有控股高科技企业和混合所有制企业四类公共数据授权运营主体,其中,地方国资企业有9家,国有全资企业有3家,国有控股高科技企业有7家,混合所有制企业有3家。尽管国有控股高科技企业授权运营主体数量只占1/3多一点,但是,由于这类授权运营主体在股权设置上政府控股51%以上,通常由政府部门直接管理,具有较高的安全保障,同时吸引了阿里、蚂蚁、科大讯飞、腾讯等民营高科技企业,在人工智能、数据挖掘、隐私技术等数据技术方面拥有极强的能力,因而在公共数据加工处理方面拥有较强能力,并能开发出有市场竞争力的数据产品和服务。因此,国有控股高科技企业将成为主流的授权运营主体。
相关阅读
1. 涂群等:我国公共数据授权运营的三大模式及其特点
2. 涂群等:国家和地方层面公共数据授权运营的探索历程
3. 涂群等:我国公共数据授权运营及其相关的五个概念
4. 张茜茜等:我国公共数据开发的四大趋势
5. 张茜茜等:我国公共数据开发开放的七大特征
6. 张茜茜等:我国公共数据开发开放历经的四大发展阶段
7. 涂群等:国家数据基础设施(NDI)发展趋势
8. 涂群等:国家数据基础设施(NDI)取得成就
9. 涂群等:国家数据基础设施(NDI)的演进特点
10. 涂群等:国家数据基础设施(NDI)的演进历程
11. 涂群等:国家数据基础设施(NDI)的涵义与构成
12. 张茜茜等:我国数据要素制度体系的五大趋势
13. 张茜茜等:我国数据要素制度体系的九大特点
14. 张茜茜等:我国各地方数据要素制度体系的探索
原创内容,转载必须注明出处(“交大评论”公众号),侵权必究。